### [Урок 3. EDA (exploratory data analysis) или Разведочный анализ](https://gb.ru/lessons/447655/homework)

#### Задание 1

Даны значения зарплат из выборки выпускников: 100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 24, 57, 55, 70, 75, 65, 84, 90, 150. Посчитать (желательно без использования статистических методов наподобие std, var, mean) среднее арифметическое, среднее квадратичное отклонение, смещенную и несмещенную оценки дисперсий для данной выборки.

*1. Среднее арифметическое (Mean)*

> Количество значений $(n) = 20$

> Вычислим сумму всех значений:
$\sum=100+80+75+77+89+33+45+25+65+17+30+24+57+55+70+75+65+84+90+150=1326$

> Среднее арифметическое:
$\overline {x} = \frac {1326}{20} = 66.3$

*2. Смещенная и несмещенная оценки дисперсий*

> Дисперсия показывает, насколько значения разбросаны вокруг среднего. Смещенная оценка дисперсии (biased variance) и несмещенная оценка дисперсии (unbiased variance) рассчитываются по-разному.

>Смещенная оценка дисперсии:
$σ_b^2 = \frac 1n ∑_{i=1}^n(x_i−\overline {x})^2$

> Несмещенная оценка дисперсии:
$σ_u^2 = \frac 1{n-1} ∑_{i=1}^n(x_i−\overline {x})^2$

> Вычислим разности и их квадраты:
$(100−66.3)^2=1115.69$
$(80−66.3)^2=187.69$
$(75−66.3)^2=74.89$
$(77−66.3)^2=113.29$
$(89−66.3)^2=515.29$
$(33−66.3)^2=1102.09$
$(45−66.3)^2=454.09$
$(25−66.3)^2=1711.69$
$(65−66.3)^2=1.69$
$(17−66.3)^2=2422.89$
$(30−66.3)^2=1314.49$
$(24−66.3)^2=1804.49$
$(57−66.3)^2=86.49$
$(55−66.3)^2=127.69$
$(70−66.3)^2=13.69$
$(75−66.3)^2=74.89$
$(65−66.3)^2=1.69$
$(84−66.3)^2=313.29$
$(90−66.3)^2=561.69$
$(150−66.3)^2=7044.09$

>Сумма квадратов разностей $=17235.4$

>Смещенная оценка дисперсии:
$σ_b^2 = \frac {17235.4}{20}=861.77$

> Несмещенная оценка дисперсии:
$σ_u^2 = \frac {17235.4}{19}=907.13$

*3. Среднее квадратичное отклонение (Standard Deviation)*
Среднее квадратичное отклонение является квадратным корнем из дисперсии.

> Смещенное среднее квадратичное отклонение:
$σ_b = \sqrt{σ_b^2} ≈ 29.35$

> Несмещенное среднее квадратичное отклонение:
$σ_u = \sqrt{σ_u^2} ≈ 30.11$

#### Задание 2

В первом ящике находится 8 мячей, из которых 5 - белые. Во втором ящике - 12 мячей, из которых 5 белых. Из первого ящика вытаскивают случайным образом два мяча, из второго - 4. Какова вероятность того, что 3 мяча белые?

> Возможные варианты:
>
>- 2 белых мяча из первого ящика и 1 белый мяч из второго ящика.
>- 1 белый мяч из первого ящика и 2 белых мяча из второго ящика.
>- 0 белых мячей из первого ящика и 3 белых мяча из второго ящика.

> Вариант 1:
P(A=2) $= \frac {C^2_5 × C^0_3}{C^2_8} = \frac {5}{14}$
P(B=1) $= \frac {C^1_5 × C^3_7}{C^4_{12}} = \frac {35}{99}$
Вероятность для случая 1:
P(случай 1) = P(A=2) × P(B=1) $= \frac{25}{198}$

> Вариант 2:
P(A=1) $= \frac {C^1_5 × C^1_3}{C^2_8} = \frac {15}{28}$
P(B=2) $= \frac {C^2_5 × C^2_7}{C^4_{12}} = \frac {14}{33}$
Вероятность для случая 2:
P(случай 2) = P(A=1) × P(B=2) $= \frac{15}{66}$

> Вариант 3:
P(A=0) $= \frac {C^0_5 × C^2_3}{C^2_8} = \frac {3}{28}$
P(B=3) $= \frac {C^3_5 × C^1_7}{C^4_{12}} = \frac {2}{14}$
Вероятность для случая 3:
P(случай 2) = P(A=0) × P(B=3) $= \frac{1}{33}$

> Общая вероятность:
P(ровно 3 белых) = P(случай 1) + P(случай 2) + P(случай 3)
P(ровно 3 белых) = $\frac {38}{99} ≈ 0.3838$

#### Задание 3

На соревновании по биатлону один из трех спортсменов стреляет и попадает в мишень. Вероятность попадания для первого спортсмена равна 0.9, для второго — 0.8, для третьего — 0.6. Найти вероятность того, что выстрел произведен:
a). первым спортсменом
б). вторым спортсменом
в). третьим спортсменом.

Для решения этой задачи используем теорему Байеса. Обозначим события следующим образом:

- \( A_1 \) — выстрел производит первый спортсмен.
- \( A_2 \) — выстрел производит второй спортсмен.
- \( A_3 \) — выстрел производит третий спортсмен.
- \( B \) — событие, что выстрел попадает в мишень.

Нам известны априорные вероятности событий \( A_1 \), \( A_2 \) и \( A_3 \), а также условные вероятности \( P(B|A_1) \), \( P(B|A_2) \) и \( P(B|A_3) \):

\[ P(A_1) = P(A_2) = P(A_3) = \frac{1}{3} \]
\[ P(B|A_1) = 0.9 \]
\[ P(B|A_2) = 0.8 \]
\[ P(B|A_3) = 0.6 \]

Сначала найдем полную вероятность попадания в мишень \( P(B) \):

\[ P(B) = P(B|A_1)P(A_1) + P(B|A_2)P(A_2) + P(B|A_3)P(A_3) \]
\[ P(B) = (0.9 \times \frac{1}{3}) + (0.8 \times \frac{1}{3}) + (0.6 \times \frac{1}{3}) \]
\[ P(B) = 0.3 + 0.2667 + 0.2 \]
\[ P(B) = 0.7667 \]

Теперь, используя теорему Байеса, найдем апостериорные вероятности \( P(A_1|B) \), \( P(A_2|B) \) и \( P(A_3|B) \):

> Вероятность того, что выстрел произведен первым спортсменом:
\[ P(A_1|B) = \frac{P(B|A_1)P(A_1)}{P(B)} \]
\[ P(A_1|B) = \frac{0.9 \times \frac{1}{3}}{0.7667} \]
\[ P(A_1|B) = \frac{0.3}{0.7667} \]
\[ P(A_1|B) \approx 0.3912 \]

> Вероятность того, что выстрел произведен вторым спортсменом:
\[ P(A_2|B) = \frac{P(B|A_2)P(A_2)}{P(B)} \]
\[ P(A_2|B) = \frac{0.8 \times \frac{1}{3}}{0.7667} \]
\[ P(A_2|B) = \frac{0.2667}{0.7667} \]
\[ P(A_2|B) \approx 0.3479 \]

> Вероятность того, что выстрел произведен третьим спортсменом:
\[ P(A_3|B) = \frac{P(B|A_3)P(A_3)}{P(B)} \]
\[ P(A_3|B) = \frac{0.6 \times \frac{1}{3}}{0.7667} \]
\[ P(A_3|B) = \frac{0.2}{0.7667} \]
\[ P(A_3|B) \approx 0.2609 \]

#### Задание 4

В университет на факультеты A и B поступило равное количество студентов, а на факультет C студентов поступило столько же, сколько на A и B вместе. Вероятность того, что студент факультета A сдаст первую сессию, равна 0.8. Для студента факультета B эта вероятность равна 0.7, а для студента факультета C - 0.9. Студент сдал первую сессию. Какова вероятность, что он учится: a). на факультете A б). на факультете B в). на факультете C?

Для решения этой задачи мы используем теорему Байеса.

### Обозначения

- \( A \) — студент учится на факультете A,
- \( B \) — студент учится на факультете B,
- \( C \) — студент учится на факультете C,
- \( S \) — студент сдал первую сессию.

### Дано

- Вероятность того, что студент сдаст первую сессию, если он учится на факультете A: \( P(S|A) = 0.8 \),
- Вероятность того, что студент сдаст первую сессию, если он учится на факультете B: \( P(S|B) = 0.7 \),
- Вероятность того, что студент сдаст первую сессию, если он учится на факультете C: \( P(S|C) = 0.9 \),
- Вероятности того, что студент учится на факультетах A, B, и C: \( P(A) \), \( P(B) \), \( P(C) \).

### Вероятности поступления

Пусть на факультет A и B поступило по \( x \) студентов, тогда на факультет C поступило \( 2x \) студентов. Итак:

- Вероятность того, что случайно выбранный студент учится на факультете A: \( P(A) = \frac{x}{4x} = \frac{1}{4} \),
- Вероятность того, что случайно выбранный студент учится на факультете B: \( P(B) = \frac{x}{4x} = \frac{1}{4} \),
- Вероятность того, что случайно выбранный студент учится на факультете C: \( P(C) = \frac{2x}{4x} = \frac{1}{2} \).

### Общая вероятность сдачи сессии \( P(S) \)

По формуле полной вероятности:

\[ P(S) = P(S|A)P(A) + P(S|B)P(B) + P(S|C)P(C) \]

Подставим значения:

\[ P(S) = (0.8 \cdot \frac{1}{4}) + (0.7 \cdot \frac{1}{4}) + (0.9 \cdot \frac{1}{2}) \]
\[ P(S) = 0.2 + 0.175 + 0.45 = 0.825 \]

### Вероятность того, что студент учится на факультете A, если он сдал первую сессию \( P(A|S) \)

По теореме Байеса:

\[ P(A|S) = \frac{P(S|A)P(A)}{P(S)} \]

Подставим значения:

\[ P(A|S) = \frac{0.8 \cdot \frac{1}{4}}{0.825} = \frac{0.2}{0.825} \approx 0.242 \]

### Вероятность того, что студент учится на факультете B, если он сдал первую сессию \( P(B|S) \)

По теореме Байеса:

\[ P(B|S) = \frac{P(S|B)P(B)}{P(S)} \]

Подставим значения:

\[ P(B|S) = \frac{0.7 \cdot \frac{1}{4}}{0.825} = \frac{0.175}{0.825} \approx 0.212 \]

### Вероятность того, что студент учится на факультете C, если он сдал первую сессию \( P(C|S) \)

По теореме Байеса:

\[ P(C|S) = \frac{P(S|C)P(C)}{P(S)} \]

Подставим значения:

\[ P(C|S) = \frac{0.9 \cdot \frac{1}{2}}{0.825} = \frac{0.45}{0.825} \approx 0.545 \]

### Ответы

- Вероятность того, что студент учится на факультете A: \( P(A|S) \approx 0.242 \) или \( 24.2\% \),
- Вероятность того, что студент учится на факультете B: \( P(B|S) \approx 0.212 \) или \( 21.2\% \),
- Вероятность того, что студент учится на факультете C: \( P(C|S) \approx 0.545 \) или \( 54.5\% \).

#### Задание 5

Устройство состоит из трех деталей. Для первой детали вероятность выйти из строя в первый месяц равна 0.1, для второй - 0.2, для третьей - 0.25. Какова вероятность того, что в первый месяц выйдут из строя: а). все детали б). только две детали в). хотя бы одна деталь г). от одной до двух деталей?

Давайте рассмотрим каждую задачу отдельно и найдем вероятности.

### Обозначения

- \( A \) — первая деталь вышла из строя в первый месяц (вероятность \( P(A) = 0.1 \)),
- \( B \) — вторая деталь вышла из строя в первый месяц (вероятность \( P(B) = 0.2 \)),
- \( C \) — третья деталь вышла из строя в первый месяц (вероятность \( P(C) = 0.25 \)).

### Задача (а): Вероятность того, что выйдут из строя все детали

Вероятность того, что все три детали выйдут из строя, можно найти, умножив вероятности для каждой детали (так как события независимы):

\[ P(A \cap B \cap C) = P(A) \cdot P(B) \cdot P(C) = 0.1 \cdot 0.2 \cdot 0.25 = 0.005 \]

### Задача (б): Вероятность того, что выйдут из строя только две детали

Для этого нужно рассмотреть все возможные комбинации выхода из строя двух деталей:

1. Вышли из строя первая и вторая детали, а третья осталась исправной:
\[ P(A \cap B \cap \neg C) = P(A) \cdot P(B) \cdot (1 - P(C)) = 0.1 \cdot 0.2 \cdot 0.75 = 0.015 \]

2. Вышли из строя первая и третья детали, а вторая осталась исправной:
\[ P(A \cap \neg B \cap C) = P(A) \cdot (1 - P(B)) \cdot P(C) = 0.1 \cdot 0.8 \cdot 0.25 = 0.02 \]

3. Вышли из строя вторая и третья детали, а первая осталась исправной:
\[ P(\neg A \cap B \cap C) = (1 - P(A)) \cdot P(B) \cdot P(C) = 0.9 \cdot 0.2 \cdot 0.25 = 0.045 \]

Теперь суммируем эти вероятности:

\[ P(\text{ровно 2 из 3}) = 0.015 + 0.02 + 0.045 = 0.08 \]

### Задача (в): Вероятность того, что выйдет из строя хотя бы одна деталь

Эту вероятность удобнее всего найти через противоположное событие — что ни одна деталь не выйдет из строя:

\[ P(\text{ни одна не выйдет из строя}) = (1 - P(A)) \cdot (1 - P(B)) \cdot (1 - P(C)) = 0.9 \cdot 0.8 \cdot 0.75 = 0.54 \]

Тогда вероятность того, что выйдет из строя хотя бы одна деталь:

\[ P(\text{хотя бы одна выйдет из строя}) = 1 - P(\text{ни одна не выйдет из строя}) = 1 - 0.54 = 0.46 \]

### Задача (г): Вероятность того, что выйдет из строя от одной до двух деталей

Для этого нужно рассмотреть случаи, когда выйдет из строя одна деталь и когда выйдут из строя две детали. Мы уже нашли вероятность для двух деталей.

1. Вероятность того, что выйдет из строя ровно одна деталь:

    1. Вышла из строя первая деталь, а остальные остались исправными:
    \[ P(A \cap \neg B \cap \neg C) = P(A) \cdot (1 - P(B)) \cdot (1 - P(C)) = 0.1 \cdot 0.8 \cdot 0.75 = 0.06 \]

    2. Вышла из строя вторая деталь, а остальные остались исправными:
    \[ P(\neg A \cap B \cap \neg C) = (1 - P(A)) \cdot P(B) \cdot (1 - P(C)) = 0.9 \cdot 0.2 \cdot 0.75 = 0.135 \]

    3. Вышла из строя третья деталь, а остальные остались исправными:
    \[ P(\neg A \cap \neg B \cap C) = (1 - P(A)) \cdot (1 - P(B)) \cdot P(C) = 0.9 \cdot 0.8 \cdot 0.25 = 0.18 \]

    Теперь суммируем эти вероятности:

    \[ P(\text{ровно 1 из 3}) = 0.06 + 0.135 + 0.18 = 0.375 \]

2. Вероятность того, что выйдут из строя от одной до двух деталей:

    \[ P(\text{от одной до двух из 3}) = P(\text{ровно 1 из 3}) + P(\text{ровно 2 из 3}) \]
    \[ P(\text{от одной до двух из 3}) = 0.375 + 0.08 = 0.455 \]

### Ответы

а) Вероятность того, что все детали выйдут из строя: \( P(A \cap B \cap C) = 0.005 \).

б) Вероятность того, что выйдут из строя только две детали: \( P(\text{ровно 2 из 3}) = 0.08 \).

в) Вероятность того, что выйдет из строя хотя бы одна деталь: \( P(\text{хотя бы одна выйдет из строя}) = 0.46 \).

г) Вероятность того, что выйдет из строя от одной до двух деталей: \( P(\text{от одной до двух из 3}) = 0.455 \).
